概念

CUDA 平台（CUDA）

概念解析

定义与起源

CUDA（Compute Unified Device Architecture）是 NVIDIA 在 2006 年发布的并行计算编程模型。它是加速计算的软件层——没有 CUDA，GPU 只是一颗显卡；有了 CUDA，GPU 才成为通用的并行加速器。

黄仁勋在 2023-10 Acquired - 黄仁勋深度访谈里纠正了一个常见误解——很多人以为 NVIDIA 是"先做技术再变平台"，但他说："从第一天起，我们就是一家平台公司。" CUDA 的前身是 1993 年 NVIDIA 成立时就存在的 UDA（Unified Device Architecture），CUDA 是 UDA 的 C 语言版本。

"Direct NV existed before DirectX. We are the only accelerator on the planet where every single accelerator is architecturally compatible with the others. At 30 years, it's all completely compatible. That's the only unnegotiable rule in our company. Everything else is negotiable."

"我们是地球上唯一一家所有加速器之间都架构兼容的公司。30 年来，所有芯片都完全兼容。这是公司里唯一不可谈判的铁律，其他的都可以谈。"
——2023-10 Acquired - 黄仁勋深度访谈

核心要义

第一，CUDA 不是一个软件，而是一整个库的生态。

"People think CUDA is software. There's a whole bunch of libraries on top of CUDA—and that's the libraries that make AI possible."

"人们以为 CUDA 是一个软件，其实 CUDA 之上有一整个库的生态，而正是这些库让 AI 成为可能。"
——2025-03 GTC 2025 - Blackwell Ultra 与 Vera Rubin

到 2025 年，CUDA-X 库已经覆盖：cuLitho（计算光刻）、cuOPT（组合优化）、cuQuantum（量子模拟）、cuDSS（CAE）、Warp（物理仿真）、Earth-2（气候）、cuDNN（深度学习）……每一个库都是黄仁勋所说的"一次一个领域"长期攻下来的。

第二，CUDA 的护城河是装机量，不是技术本身。

这是 CUDA 这个概念里最反直觉的论点——也是装机量定义架构这一卡片的源头。在 2026-03 Lex Fridman 494 - 4 万亿公司与 AGI 里，黄仁勋一锤定音：

"Our single most important property as a company is the install base of our computing platform. It's the install base of CUDA. If somebody came up with a GUDA or TUDA, it wouldn't make any difference. Because it's never been just about the technology. It was 43,000 people that made CUDA successful."

"我们最重要的资产是计算平台的装机量——也就是 CUDA 的装机量。如果今天有人推出一个 GUDA 或者 TUDA，根本不会有任何意义。因为这从来不只是技术的问题——是 43,000 个人让 CUDA 成为 CUDA。"
——2026-03 Lex Fridman 494 - 4 万亿公司与 AGI

第三,CUDA 是十几年的"信念折磨"。

把 CUDA 放进每一张 GeForce 的决定，让 NVIDIA 的市值从 70 亿美金跌到 15 亿美金，跌了很多年：

"CUDA increased our cost so tremendously, it completely consumed all of the company's gross profit dollars. NVIDIA is the house that GeForce built, because it was GeForce that took CUDA out to everybody."

"CUDA 让我们的成本暴增，把公司的整个毛利润全部吃光。NVIDIA 是 GeForce 盖起来的这栋房子——是 GeForce 把 CUDA 带给了所有人。"
——2026-03 Lex Fridman 494 - 4 万亿公司与 AGI

"Your belief system has to be really, really strong. You have to really, really believe it and really, really want it. Otherwise, it's just too much to endure."

"你的信念系统必须非常、非常强大。你必须真的真的相信它，真的真的想要它。否则这种折磨你根本承受不了。"
——2023-10 Acquired - 黄仁勋深度访谈

实践应用

2006 年：CUDA 1.0 发布，最初服务于科学计算（分子动力学、CT 重建、地震处理）
2012 年：Geoffrey Hinton、Ilya Sutskever、Alex Krizhevsky 用 GeForce GTX 580 上的 CUDA 训练 AlexNet
2016 年：黄仁勋把第一台 DGX-1 送到 OpenAI，CUDA 正式成为深度学习的事实标准
2023-2026 年：Hugging Face 上 150 万个 AI 模型全部跑在 CUDA 上（2026-Q4 NVIDIA FY26 财报）
2025 年：CUDA 13 → CUDA 14。所有 Volta、Pascal、Ampere、Hopper、Blackwell 之间架构兼容

常见误区

误区一：CUDA 是 GPU 的驱动程序。
错。CUDA 是一整个并行编程模型 + 编译器 + 库 + 运行时 + 工具链 + 几百个上层加速库的生态。

误区二：CUDA 可以被一个开源替代品轻松替代。
错。43,000 名 NVIDIA 工程师 + 20 年的库积累 + 几亿装机量 + 上千万开发者社区 = 一道在工程层面无法被一夜复制的护城河。这是黄仁勋在 2025-09 BG2 Pod - OpenAI 与算力未来里反复强调的"ASIC 永远追不上"的根本原因。

误区三：等专用 ASIC 成熟，CUDA 的灵活性就不值钱了。
错——而且方向反了。Transformer 架构每 6 个月在变；agentic AI 每 6 个月在变；推理流水线（prefill / decode / KV cache 路由）每 6 个月在变。正是 CUDA 的可编程性让这些实验和迭代成为可能。

黄仁勋原话精选

"Install base defines an architecture. Everything else is secondary."
"装机量定义架构。其他一切都是次要的。"
——2026-03 Lex Fridman 494 - 4 万亿公司与 AGI

"If I support CUDA, tomorrow it'll be 10 times better. I just have to wait six months on average. If I develop on CUDA, I reach a few hundred million computers. I'm in every cloud, every computer company, every industry, every country."
"如果我支持 CUDA，明天它会再快 10 倍——平均我只要等 6 个月。如果我在 CUDA 上开发，我能触及数亿台计算机——每一朵云、每一家计算机公司、每一个行业、每一个国家。"
——2026-03 Lex Fridman 494 - 4 万亿公司与 AGI

"We are the only accelerator on the planet where every single accelerator is architecturally compatible with the others."
"我们是地球上唯一一家所有加速器之间架构完全兼容的公司。"
——2023-10 Acquired - 黄仁勋深度访谈

思想演变

1993-2006 年：UDA 时代，CUDA 还没正式命名，只服务于图形和早期通用计算
2007 年：CUDA 通过 GeForce 进入每一台游戏 PC——市值因此跌到 15 亿美金
2012 年：AlexNet 让 CUDA 找到第一个真正的"杀手应用"
2016 年：DGX 把 CUDA 包装成完整的 AI 超级计算机
2023 年：ChatGPT 之后，CUDA 成为全球 AI 基础设施的"事实操作系统"
2026 年：CUDA 装机量成为 NVIDIA 最深的护城河——比任何架构创新都重要

典型案例

AlexNet (2012)：CUDA 第一次和 AI 接触
OpenAI / ChatGPT：CUDA 上训练出来的最有名的产品
Hugging Face 150 万个模型：CUDA 装机量护城河的当代证据（2026-Q4 NVIDIA FY26 财报）
TensorRT-LLM + Dynamo：CUDA 之上的推理优化栈

链接到本页 34

…奇们打造工具——为了做到这件事，我们也在共同创造未来。" 然后是一组让人印象深刻的生态数字：累计出货超过 10 亿颗 CUDA 平台 GPU、云上 250 exaflops 的 GPU 算力、250 万名开发者、7500 家初创公司。他引用了 2012…